11 de septiembre de 2015
Resumen:
A procura crescente por monitorização e controlo on-line de processos industriais e suas variáveis associadas, e dificuldades relacionadas com os sistemas de medição disponíveis têm levado ao desenvolvimento de modelos de predição chamados Sensores Virtuais (SVs). SVs utilizam métodos de inteligência computacional para estimar variáveis difíceis de medir tendo por base a utilização de variáveis fáceis de medir em aplicações industriais. Contudo, o desenvolvimento de SVs envolve algumas di- ficuldades. O desempenho do SV depende da qualidade dos dados utilizados para extrair conhecimento durante o procedimento de identificação. Outro problema é que os sistemas industriais possuem várias características complexas (por exemplo, não-linearidade e variância no tempo). Assim, trazer SVs para aplicações industriais reais é um desafio. Esta tese foca no desenvolvimento de métodos de aprendizagem computacional aplicados aos SVs, com ênfase específica em metodologias para melhorar a precisão da predição e a adaptação do sistema, de modo a obter adaptabilidade e estabilidade em processos variantes no tempo e reduzir os custos de manutenção. Para lidar com estas questões, esta tese investiga o uso da combinação de múltiplos modelos de aprendizagem, um tipo de estrutura designada por sistemas ensembles. Este tipo de metodologia tem demonstrado capacidade de melhorar o desempenho e a estabilidade dos sistemas. Contudo, mecanismos eficientes para balancear a diversidade, adaptabilidade e desempenho dos modelos devem ser investigados e propostos. Assim, quatro principais objetivos de investigação e direções de investigação são considerados. O primeiro objetivo é desenvolver metodologias para a construção automática de sistemas ensemble de Redes Neuronais (RNs) em problemas de regressão. Metodologias baseadas em Algoritmos Genéticos (AG) e Simulated Annealing (SA) são propostos e comparados para selecionar o melhor subconjunto de modelos (a partir de um conjunto de modelos) para constituir o ensemble, tendo em conta os fatores principais de sistemas ensembles (ou seja, diversidade, número de modelos e estratégia de combinação). Em primeiro lugar, um conjunto de modelos com elevada diversidade é produzido. Isto é, cada modelo é treinado com diferentes dados de treino utilizando bootstrap, e a melhor arquitetura de RN é selecionada variando o número de neurónios na camada oculta, a função de ativação e a inicialização de pesos sinápticos. Em seguida, AG e SA são utilizados para selecionar o melhor subconjunto de modelos e a melhor combinação. O segundo objetivo é desenvolver um novo sistema ensemble adaptativo para regressão que seja capaz de aprender amostras na presença de vários tipos de mudanças e simultaneamente manter informações antigas em cenários em que mudanças podem reaparecer. A ideia principal é manter uma janela deslizante de dados que se move quando uma nova amostra fica disponível. Para tratar mudanças recorrentes e não-recorrentes, o sistema ensemble proposto utiliza uma nova atribuição de pesos de combinação de modelos que considera os erros dos modelos nas janelas antigas e recentes, utilizando um fator de desconto que diminui ou aumenta a contribuição de janelas antigas. Novos modelos são incluídos se a precisão do sistema estiver a diminuir, e modelos com baixa precisão podem ser removidos ao longo tempo. O terceiro objetivo é desenvolver um novo sistema ensemble adaptativo para regressão com capacidade de adaptação rápida para a predição on-line de variáveis em aplicações variantes no tempo. As propriedades do sistema ensemble proposto são: inclusão e remoção on-line de modelos para manter apenas os modelos mais precisos em relação ao estado atual do sistema; adaptação dinâmica dos pesos de combinação dos modelos baseada nas predições on-line das amostras mais recentes; e adaptação on-line dos parâmetros dos modelos. O quarto objetivo é desenvolver um novo sistema ensemble adaptativo para regressão que selecione dinamicamente o melhor subconjunto de modelos (a partir de um conjunto de modelos) para constituir o ensemble. O método proposto utiliza agregação ordenada para escolher o tamanho do ensemble e o melhor subconjunto de modelos baseados na minimização do erro do ensemble na amostra mais recente. Também é proposta uma RN adaptativa utilizando fator de esquecimento variável. A performance e eficácia das metodologias propostas são validadas e demonstradas utilizando aplicações industriais reais, incluindo a estimação da cal livre num processo de forno de cimenteira, e outros conjuntos de dados importantes para avaliar aplicações reais de SVs. Além disso, resultados experimentais utilizando conjuntos de dados artificiais com vários tipos de mudanças são apresentados para demonstrar a eficácia e precisão das metodologias propostas que lidam com ambientes variantes no tempo.
Resumen divulgativo:
Esta tesis se centra en el desarrollo de métodos de aprendizaje computacional aplicados a SS, con especial énfasis en metodologías para mejorar la precisión de la predicción y la adaptación del sistema, con el fin de lograr adaptabilidad y estabilidad en procesos variables en el tiempo y reducir los costos de mantenimiento. Para abordar estas cuestiones, esta tesis investiga el uso de combinaciones de múltiples modelos de aprendizaje, un tipo de estructura denominada ensemble. Estas metodologías han demostrado la capacidad de mejorar el rendimiento y la estabilidad de los sistemas. Sin embargo, se deben investigar y proponer mecanismos eficientes para equilibrar la diversidad, la adaptabilidad y el desempeño de los modelos. Para ello, se consideran cuatro objetivos principales de investigación y direcciones de investigación.
Palabras clave: Soft Sensors; Ensemble Learning
Cita:
S. Gomes Soares Alcalá (2015), Ensemble learning methodologies for soft sensor development in industrial processes. Coimbra (Portugal).